智能论文笔记

CoGS: Controllable Generation and Search from Sketch and Style

Cusuh Ham , Gemma Canet Tarres , Tu Bui , James Hays , Zhe Lin , John Collomosse

分类：计算机视觉

2022-03-17

我们提出了COGS，这是一种新颖的方法，用于图像的样式条件，素描驱动的合成。 COGS可以为给定的草图对象探索各种外观可能性，从而对输出的结构和外观进行了脱钩的控制。通过输入草图和基于变压器的草图和样式编码器的示例“样式”调理图像启用了对物体结构和外观的粗粒粒度控制，以生成离散的代码簿表示。我们将代码簿表示形式映射到度量空间中，从而在通过量化量化的GAN（VQGAN）解码器生成图像之前，可以对多个合成选项之间的选择和插值进行细粒度的控制和插值。我们的框架因此统一了搜索和综合任务，因为草图和样式对可以用于运行初始合成，该合成可以通过结合结合在搜索语料库中结合使用，以使图像更加与用户的意图更匹配。我们表明，我们的模型对新创建的Pseudosketches数据集的125个对象类培训，能够生产出多种语义内容和外观样式的范围。

translated by 谷歌翻译

Topic Detection in Continuous Sign Language Videos

Alvaro Budria , Laia Tarres , Gerard I. Gallego , Francesc Moreno-Noguer , Jordi Torres , Xavier Giro-i-Nieto

分类：计算机视觉 | 人工智能

2022-09-01

最近在自动手语理解中的具有挑战性的任务（例如手语识别，翻译和生产）方面取得了重大进展。但是，这些作品集中在相对较少的样本，简短录音以及有限的词汇和签名空间的数据集上。在这项工作中，我们介绍了手语主题检测的新颖任务。我们基于跨越多个语义域的大规模视频数据集的2sign的实验。我们为主题检测的任务提供了强大的基础，并在手语领域常用的不同视觉特征之间进行了比较。

translated by 谷歌翻译

Inferring subhalo effective density slopes from strong lensing observations with neural likelihood-ratio estimation

Gemma Zhang , Siddharth Mishra-Sharma , Cora Dvorkin

分类：机器学习

2022-08-29

强烈的引力透镜已成为一种有前途的方法，用于探测亚半乳尺度上的暗物质模型。最近的工作提出了Subhalo有效密度斜率比常用的Subhalo质量功能更可靠。 subhalo有效密度斜率是一个独立于对基础密度曲线的假设的测量值，可以通过传统的采样方法来推断单个Subhalos。为了超越单个Subhalo测量，我们利用机器学习的最新进展，并引入神经似然比估计器来推断Subhalos人群的有效密度斜率。我们证明我们的方法能够利用多个Subhalos（内部和跨多个图像）的统计能力来区分不同Subhalo种群的特征。神经似然比估计量对传统抽样的估计值所需的计算效率可以实现对暗物质遗传的统计研究，并且特别有用，因为我们希望从即将进行的调查中涌入强镜头系统。

translated by 谷歌翻译

Net2Brain: A Toolbox to compare artificial vision models with human brain responses

Domenic Bersch , Kshitij Dwivedi , Martina Vilas , Radoslaw M. Cichy , Gemma Roig

分类：计算机视觉 | 人工智能

2022-08-20

我们介绍了Net2Brain，这是一种图形和命令行的用户界面工具箱，用于比较人工深神经网络（DNNS）和人脑记录的代表空间。尽管不同的工具箱仅促进单个功能或仅关注一小部分监督图像分类模型，但Net2Brain允许提取600多个受过培训的DNN的激活，以执行各种视觉相关的任务（例如，语义段，深度估计，深度估计，深度估计，深度估计，估计，深度率，在图像和视频数据集上均具有动作识别等）。该工具箱在这些激活上计算代表性差异矩阵（RDM），并使用代表性相似性分析（RSA），加权RSA（在特定的ROI和探照灯搜索中）将其与大脑记录进行比较。此外，可以在工具箱中添加一个新的刺激和大脑记录数据集以进行评估。我们通过一个示例展示了如何使用Net2Brain的功能和优势来检验认知计算神经科学的假设。

translated by 谷歌翻译

Using Sentence Embeddings and Semantic Similarity for Seeking Consensus when Assessing Trustworthy AI

Dennis Vetter , Jesmin Jahan Tithi , Magnus Westerlund , Roberto V. Zicari , Gemma Roig

分类：人工智能

2022-08-09

评估人工智能系统的可信赖性需要许多不同学科的知识。这些学科不一定在它们之间共享概念，并且可能使用具有不同含义的单词，甚至使用相同的单词不同。此外，来自不同学科的专家可能不知道其他学科中很容易使用的专业术语。因此，评估过程的核心挑战是确定来自不同学科的专家何时谈论相同的问题，但使用不同的术语。换句话说，问题是将问题描述（又称问题）分组具有相同的语义含义，但使用略有不同的术语进行了描述。在这项工作中，我们展示了我们如何采用自然语言处理的最新进展，即句子嵌入和语义文本相似性，以支持此识别过程，并弥合跨学科专家团队中评估人工智能系统可信赖的跨学科沟通差距。

translated by 谷歌翻译

Unstructured Road Segmentation using Hypercolumn based Random Forests of Local experts

Prassanna Ganesh Ravishankar , Antonio M. Lopez , Gemma M. Sanchez

分类：计算机视觉

2022-07-23

基于单眼的道路检测方法主要基于机器学习方法，依靠分类和提取精度以及外观，照明和天气变化。传统方法将预测引入条件随机字段或马尔可夫随机场模型中，以改善基于结构的中间预测。这些方法是基于优化的，因此资源很重且缓慢，使其不适合实时应用。我们提出了一种方法，可以通过具有基于超级像素的机器学习功能的本地专家的随机森林分类器来检测和细分道路。随机森林从预先训练的卷积神经网络-VGG-16中吸入机器学习的描述符。这些功能还集中在各自的超级像素中，从而使本地结构保持连续。我们将算法与基于Nueral网络的方法和传统方法（基于手工制作的功能）进行了比较，在结构化的道路（Camvid和Kitti）和非结构化的道路数据集上进行了比较。最后，我们介绍了一个带有1000个带注释的图像的道路场景数据集，并验证我们的算法在非城市和农村道路方案中效果很好。

translated by 谷歌翻译

What do navigation agents learn about their environment?

Kshitij Dwivedi , Gemma Roig , Aniruddha Kembhavi , Roozbeh Mottaghi

分类：计算机视觉 | 机器学习 | 机器人

2022-06-17

当今的最先进的视觉导航代理通常由大型深度学习模型端到端组成。这样的模型几乎没有关于学习的技能或对环境所采取的代理商的行为几乎没有解释性。尽管过去的作品探索了解释深度学习模型，但很少关注解释体现的AI系统，这通常涉及对环境结构，目标特征和行动的结果进行推理。在本文中，我们介绍了用于点目标和对象目标导航剂的具体代理（ISEE）的可解释性系统。我们使用ISEE来探测这些试剂产生的动态表示，以了解有关代理和环境的信息。我们在使用ISEE的情况下展示了有关导航剂的有趣见解，包括能够编码可到达位置的能力（避免障碍），目标的可见性，最初产卵位置的进展以及当我们掩盖关键关键时对代理行为的巨大影响个别神经元。该代码可在以下网址找到：https：//github.com/allenai/isee

translated by 谷歌翻译

FRIDA -- Generative Feature Replay for Incremental Domain Adaptation

Sayan Rakshit , Anwesh Mohanty , Ruchika Chavhan , Biplab Banerjee , Gemma Roig , Subhasis Chaudhuri

分类：计算机视觉 | 机器学习

2021-12-28

我们在本文中解决了增量无监督域适应（IDA）的新问题。我们假设标记的源域和不同的未标记的目标域通过约束逐步观察到与当前域的数据仅一次可用。目标是为当前域概括为所有过去域的准确性。 IDA设置因域之间的突然差异以及包括源域内的过去数据的不可用。受到生成功能重放的概念的启发，我们提出了一种名为特征重放的增量域适应（Frida）的新颖框架，它利用了一个名为域 - 通用辅助分类GaN（DGAC-GaN）的新的增量生成对抗性网络（GAN）来生产域明确的特征表示无缝。对于域对齐，我们提出了一种简单的扩展名为Dann-Ib的流行域对抗神经网络（Dann），鼓励歧视域 - 不变和任务相关的特征学习。 Office-Home，Office-Caltech和Domainnet数据集的实验结果证实，FIDA维护了卓越的稳定性可塑性权衡，而不是文献。

translated by 谷歌翻译

TinyML Platforms Benchmarking

Anas Osman , Usman Abid , Luca Gemma , Matteo Perotto , Davide Brunelli

分类：机器学习 | 神经与进化计算

2021-11-30

最新技术用于机器学习（ML）的最先进的超低功耗嵌入式设备的进展允许新的产品类别，其关键功能使ML功能在微控制器上能够具有小于1 MW功耗（TINYML）。Tinyml通过在低功耗嵌入式设备上聚合和分析边缘的数据来提供唯一的解决方案。但是，我们最近只能在微控制器上运行ml，并且该领域仍处于初期，这意味着硬件，软件和研究正在变化非常迅速。因此，已经为不同的平台开发了许多TinyML框架，以便于部署ML模型并标准化该过程。因此，在本文中，我们专注于基准标记的两个流行框架：Tensorflow Lite Micro（TFLM）在STM32-Nucleof401上的Arduino Nano BLE和Cube Ai上的Tensorflow Lite Micro（TFLM），为特定应用提供标准化的框架选择标准。

translated by 谷歌翻译

Curriculum learning for improved femur fracture classification: scheduling data with prior knowledge and uncertainty

Amelia Jiménez-Sánchez , Diana Mateus , Sonja Kirchhoff , Chlodwig Kirchhoff , Peter Biberthaler , Nassir Navab , Miguel A. González Ballester , Gemma Piella

分类：计算机视觉

2020-07-31

来自X射线图像的近端股骨骨折的足够分类对于治疗选择和患者的临床结果至关重要。我们依赖于常用的AO系统，该系统描述了将图像分类为类型和亚型的分层知识树根据裂缝的位置和复杂性。在本文中，我们提出了一种基于卷积神经网络（CNN）自动分类近端股骨骨折的近端骨折分类为3和7 AO类。如已知所知，CNNS需要具有可靠标签的大型和代表性数据集，这很难收集手头的应用。在本文中，我们设计了一个课程学习（CL）方法，在这种情况下通过基本的CNNS性能提高。我们的小说配方团结了三个课程策略：单独加权培训样本，重新排序培训集，以及数据采样子集。这些策略的核心是评分函数排名训练样本。我们定义了两种小说评分函数：一个来自域的特定于域的先前知识和原始的自我节奏的不确定性分数。我们对近端股骨射线照片的临床数据集进行实验。课程改善了近端股骨骨折分类，达到了经验丰富的创伤外科医生的性能。最佳课程方法根据现有知识重新排列培训集，从而达到15％的分类提高。使用公开可用的MNIST DataSet，我们进一步讨论并展示了我们统一的CL配方对三个受控和具有挑战性的数字识别方案的好处：具有有限的数据，在类别 - 不平衡下以及在标签噪声存在下。我们的工作代码可在：https://github.com/ameliajimenez/curriculum-learning-prior -unctainty。

translated by 谷歌翻译